技術問答
技術文章
iT 徵才
Tag
聊天室
2025 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2021 iThome 鐵人賽
DAY
26
0
DevOps
中台化轉型
系列 第
26
篇
大數據平台:資料倉儲
13th鐵人賽
HO-HSUN
2021-09-26 02:16:36
1072 瀏覽
分享至
Hive
適用於 PB 等級大數據的儲存,分析和查詢,處李日誌分析和用戶行為模型訓練。
SQL 語法支援
將查詢語法轉換為「抽象語法樹(Abstract Syntax Tree, AST)」以及使用者自定義函式(User-Defined Function, UDF) 產生執行計畫。
結構化資料模型
透過 MetaStore 管理系統元資料,將實際資料儲存於 HDFS,支援多種資料格式:TextFile、SequenceFile、ORCFile、Parquet 和 Avro。
資料運算模組
支援 MapReduce、Spark。
Presto
適用於 GB 到 TB 等級的資料量,在需要即時回應的資料查詢場警,提升商業化服務。
使芿基於「記憶池(Memory Pool)」的資料模型。
系統架構:
Cordinator:負責語法解析產生執行計畫,節點(Worker)管理及任務分發。
Worker:負責與 Hive 和 HDFS 互動,執行任務及實際運算。
SQL 查詢優化,提高系統問定性和執行效率,支援不同資料來源的即時跨平台資料計算。
留言
追蹤
檢舉
上一篇
大數據平台:分散式協調
下一篇
大數據平台:分散式計算
系列文
中台化轉型
共
30
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
26
大數據平台:資料倉儲
27
大數據平台:分散式計算
28
大數據平台:分散式檔案
29
大數據平台:訊息中介
30
大數據平台:叢集管理
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19864
篇
完賽人數
529
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
關於中華nokia數據機DHCP問題
.NET C# 資料庫 CRUD 專案,實務上會怎麼安排單元測試 / 整合測試?xUnit 可以直接拿來寫整合測試嗎?
OUTLOOK無法搜尋、無法建立索引且無法執行Windows Search
.NET FRAMEWORK 3.5 安裝
不能關機
鼎新ERP WorkFlow GP3升級到AiGP
Fortigate防火牆的選擇??
熱門回答
.NET FRAMEWORK 3.5 安裝
關於中華nokia數據機DHCP問題
.NET C# 資料庫 CRUD 專案,實務上會怎麼安排單元測試 / 整合測試?xUnit 可以直接拿來寫整合測試嗎?
不能關機
鼎新ERP WorkFlow GP3升級到AiGP
熱門文章
VScode 開發應用系統專案(2) - 應用系統建置前準備工具類程式
再見了 Ingress NGINX
[技術實戰] 拒絕雲端洩密!我用 Docker + Llama 3 打造工程師專用的「100% 離線」AI 研發資料庫
坊間ISO課程個人理解
生產排程是什麼?從基礎到應用的完整介紹
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}